nvidiadgxsparkvs

AI旗舰遇上性能猛兽：NVIDIADGXSparkvs极摩客EVOX强劲对决

下面把过程、数据和细节，从结果往回倒着说清楚。先说最直观的：在真实任务里跑对话模型，使用感受才能说明问题。用70B级别模型跑交互对话时，DGX Spark的Token生成通常在5到8 tokens/s之间，首次响应要等3到5秒，工程上它靠FP4这种低精度量化换